inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[예시문제 작업형2] EDA 중 이상치 처리

해결된 질문

417

가보자고

작성한 질문수 9

0

안녕하세요.

강의 잘 듣고 있습니다.

예시문제 작업형2 풀면서

X_train.describe() 기초통계량 볼 때(3:56)

총 구매액, 최대 구매액의 최소값이 음수여서...

이상치로 판단하고 금액이 <0인 행은 drop..처리하고 했는데 괜찮은 걸까요?

괜찮다면 결측치처리를 X_train, y_train 동시에 해주는 것처럼 결측치도 두 데이터에 모두 해줘야하는거죠?

캡처.PNG

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

1

퇴근후딴짓

  1. test데이터에도 음수인 값이 있는지 확인이 필요해요! 만약 있다면 해당 도메인에서 이런 데이터가 나오는 이유가 있을 수도 있기에 제거는 살짝 고민을 해봐야 합니다.

  2. 제가 추천하는 방식은 최소한의 전처리로 베이스라인(기초) 모델을 만들고 평가 점수를 기록한 다음
    이상치 처리 등의 전처리 후 결과를 비교하는 것이 좋습니다. 모든 전처리의 기준을 베이스라인을 기준과 비교하는 방식을 추천해요!

 

0

가보자고

감사합니다!

질문 드립니다.

0

38

2

강의 내용 관련 질문드립니다~

0

35

2

수강 연장 문의

0

33

1

강의자료 일괄 다운로드

0

43

2

수강기간 연장 문의드립니다

0

29

1

list 문제 질문드립니다~

0

31

2

빅분기 실기 12회 재도전

0

40

1

강의 기간 연장 가능여부 검토 요청건

0

30

1

수강기간 연장 문의 드립니다

0

36

2

수강기간 연장 문의드립니다

0

47

2

질문이요

0

51

2

수강기간 연장 문의드립니다.

0

50

2

문제 3-2 질문드립니다

0

44

2

수강기간 연장 문의 드립니다.

0

58

2

변수, 칼럼 , df 구분

0

50

2

수강기간 연장 문의드립니다.

0

50

2

수강기간 연장 문의

0

48

2

수강기간 연장 문의드립니다.

0

42

2

수강기한 연장 문의

0

80

2

수강기간 연장 문의드립니다

0

57

2

결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유

0

45

2

수강기간 연장 문의드립니다.

0

71

2

수강연장 문의

0

77

2

수강연장문의

0

53

2